FILTER MODE ACTIVE

#мультимодальный ИИ

Найдено записей: 27

#мультимодальный ИИ21.11.2025

Ставка Luma AI за $900M: создание мультимодальной "мировой модели"

'Luma AI закрыла раунд на $900M и ориентируется на мультимодальные World Models, способные понимать видео, аудио и 3D-пространство. Партнёрство с саудовским суперкластером подчёркивает серьёзность намерений.'

#мультимодальный ИИ21.07.2025

Alibaba представляет Lumos-1: прорывная унифицированная автогрессивная модель для эффективной генерации видео

Alibaba представила Lumos-1 — унифицированную автогрессивную модель генерации видео, использующую MM-RoPE и AR-DF для эффективного моделирования пространственно-временных зависимостей с конкурентными результатами и эффективным обучением.

#мультимодальный ИИ28.06.2025

Alibaba представляет Qwen-VLo: продвинутую унифицированную модель для мультимодального ИИ творчества

Команда Alibaba Qwen представила Qwen-VLo — продвинутую мультимодальную модель для генерации и редактирования изображений с поддержкой нескольких языков и поэтапным созданием сцен.

#мультимодальный ИИ24.06.2025

BAAI представляет OmniGen2: прорывная унифицированная модель для мультимодального ИИ

BAAI представляет OmniGen2 — передовую унифицированную модель мультимодального ИИ, показывающую лучшие результаты в генерации изображений по тексту, редактировании и оценке контекстной согласованности среди открытых моделей.

#мультимодальный ИИ21.06.2025

Архитектура WINGS: решение проблемы забывания текста в мультимодальных крупных языковых моделях

WINGS представляет архитектуру с двойным обучающим модулем, которая балансирует внимание между текстом и изображениями в мультимодальных языковых моделях, существенно снижая забывание текста и повышая производительность.

#мультимодальный ИИ10.06.2025

VeBrain: Революция в робототехнике с объединённым мультимодальным ИИ для зрения и управления

VeBrain представляет единую мультимодальную систему ИИ, которая сочетает визуальное рассуждение и управление роботами, демонстрируя выдающиеся результаты в сложных реальных задачах.

#мультимодальный ИИ04.06.2025

NVIDIA запускает Llama Nemotron Nano VL: эффективная модель для комплексного анализа документов

NVIDIA выпустила Llama Nemotron Nano VL — компактную модель для комплексного понимания документов с эффективной мультимодальной обработкой и передовыми результатами точности.

#мультимодальный ИИ02.06.2025

MiMo-VL-7B: Продвинутая модель для визуального восприятия и мультимодального анализа

MiMo-VL-7B — мощная визуально-языковая модель от исследователей Xiaomi, показывающая передовые результаты в визуальном понимании и мультимодальном рассуждении благодаря инновационным методам обучения.

#мультимодальный ИИ28.05.2025

Как плохие данные о товарах вредят моде и какую роль в этом играет ИИ

Плохие данные о товарах в моде приводят к потерям продаж, росту возвратов и неудовлетворенности клиентов. Мультимодальный ИИ помогает повысить точность данных и оптимизировать работу ритейла.

#мультимодальный ИИ21.05.2025

Google представляет MedGemma: продвинутые мультимодальные ИИ-модели для анализа медицинских текстов и изображений

Google представила MedGemma — новый открытый набор ИИ-моделей для комплексного анализа медицинских текстов и изображений, доступный разработчикам через Hugging Face и Google Cloud.

#мультимодальный ИИ19.05.2025

Почему ИИ испытывает трудности с аналоговыми часами и что это говорит о понимании машин

'Новое исследование показывает, что GPT-4.1 испытывает трудности с точным чтением аналоговых часов из-за опоры на визуальное сопоставление шаблонов вместо концептуального понимания, что подчеркивает вызовы в мультимодальном обучении ИИ.'

#мультимодальный ИИ18.05.2025

Модели OpenAI o3 и o4-mini: новые стандарты визуального анализа и программирования

Модели OpenAI o3 и o4-mini предлагают прорывные улучшения в визуальном анализе и программировании с помощью ИИ, обеспечивая высокую точность, мультимодальную обработку и эффективные рабочие процессы.

#мультимодальный ИИ13.05.2025

Исследователи представили General-Level и General-Bench для оценки истинной синергии в мультимодальном ИИ

Новое исследование представляет General-Level и General-Bench для оценки истинной синергии в мультимодальных моделях ИИ, показывая, что современные системы недостаточно интегрированы по задачам и модальностям.

#мультимодальный ИИ09.05.2025

Ming-Lite-Uni: Революционный открытый AI-фреймворк для объединения текста и визуальных данных

Ming-Lite-Uni — инновационный открытый AI-фреймворк, объединяющий текст и визуальные данные с помощью авторегрессионной мультимодальной структуры, обеспечивая качественную генерацию и редактирование изображений с учетом контекста.

#мультимодальный ИИ09.05.2025

X-Fusion: расширение замороженных языковых моделей с визуальными возможностями без потери языковых навыков

X-Fusion предлагает архитектуру с двумя башнями, добавляя визуальные возможности к замороженным большим языковым моделям, сохраняя их языковые навыки и улучшая мультимодальную производительность.

#мультимодальный ИИ05.05.2025

UniversalRAG: Динамический мультимодальный поиск для умных ответов ИИ

UniversalRAG представляет динамическую систему маршрутизации, эффективно обрабатывающую мультимодальные запросы, выбирая наиболее релевантную модальность и уровень детализации, превосходя существующие RAG-модели.

#мультимодальный ИИ30.04.2025

Alibaba Представляет Qwen2.5-Omni-3B: Мощный Мультимодальный ИИ для Потребительских GPU с Вдвое Меньшим Использованием Видеопамяти

Alibaba представила Qwen2.5-Omni-3B — мультимодальную модель с 3 млрд параметров, которая снижает использование видеопамяти более чем на 50%, сохраняя производительность, близкую к 7 млрд модели, и подходит для потребительских GPU.

#мультимодальный ИИ30.04.2025

Google NotebookLM запускает аудио обзоры на более чем 50 языках для глобальной доступности ИИ-суммаризации

Google расширяет возможности NotebookLM, добавляя аудио обзоры на более чем 50 языках, что повышает доступность и удобство ИИ-суммирования по всему миру.

#мультимодальный ИИ25.04.2025

Skywork AI представляет R1V2: прорыв в мультимодальном рассуждении с гибридным обучением с подкреплением

Skywork AI представляет R1V2 — современную мультимодальную модель с гибридным обучением с подкреплением, которая улучшает специализированное рассуждение и обобщение, превосходя многие открытые и проприетарные модели.

#мультимодальный ИИ23.04.2025

NVIDIA Представляет Describe Anything 3B: Продвинутая Мультимодальная Модель для Точного Описания Изображений и Видео

NVIDIA представила Describe Anything 3B — мультимодальную большую языковую модель, которая превосходит существующие решения в детальном локализованном описании изображений и видео.

#мультимодальный ИИ21.04.2025

Новые возможности OpenAI: модели o3 и o4-mini с мультимодальным мышлением и интегрированными инструментами

Новые модели OpenAI o3 и o4-mini предлагают мощные возможности мультимодального мышления и интеграции инструментов, повышая точность и универсальность ИИ в работе с текстом, изображениями и кодом.